TiledAttention: un kernel SDPA de mosaico CUDA para PyTorch
TiledAttention: kernel CUDA de mosaico para SDPA en PyTorch. Optimiza la atención eficiente en transformers con bajo consumo de memoria.
TiledAttention: kernel CUDA de mosaico para SDPA en PyTorch. Optimiza la atención eficiente en transformers con bajo consumo de memoria.